Connexion
Abonnez-vous

Internet Archive en mode dégradé suite au piratage de la semaine dernière

Wayback brocken machine

Internet Archive en mode dégradé suite au piratage de la semaine dernière

Peugeot 404 error edition

Le site de la fameuse bibliothèque numérique qui archive le web fonctionne en mode très dégradé. La semaine dernière, il a subi une fuite de données concernant 31 millions d'utilisateurs et une attaque DDoS, sans pour autant que le lien entre les deux soit établi.

Le 14 octobre à 11h50

Au milieu de la semaine dernière, on apprenait qu'Internet Archive avait été piratée. Des données de 31 millions d'utilisateurs ont fuité, dont les adresses e-mails, pseudonymes, dates de changement de mot de passe, mots de passe hachés en Bcrypt des utilisateurs concernés et d’autres données internes.

Mais les serveurs de l'organisme américain à but non lucratif ont été aussi ciblés par une attaque DDoS. Si aucune information ne permet de lier les deux actes de piratage contre Internet Archive, leur concomitance met à mal la présence en ligne de la bibliothèque très connue pour son service d'archivage du web Wayback Machine.

Le site Have I been Pwned avait confirmé la fuite après avoir reçu la liste des comptes concernés. Il ajoutait que 54 % des comptes qui y figuraient étaient déjà listés dans sa base.

Seule la Wayback Machine disponible, en mode dégradé

Cinq jours après, le site d'Internet Archive affiche une page d'excuse annonçant que la plupart des services de l'organisme sont encore indisponibles.

Son fondateur, Kahle Brewster, explique ce lundi matin sur X que la Wayback Machine « a repris de manière provisoire », mais seulement « en lecture seule ». On peut donc de nouveau consulter les archives du web, mais il est encore impossible d'ajouter de nouvelles pages ou la mise à jour d'une page dans la Wayback Machine.

Il ajoute que l'activité d'Internet Archive va pouvoir reprendre en toute sécurité, mais « que cela pourrait nécessiter une maintenance supplémentaire ».

Jeudi, il expliquait que les équipes de l'organisme avaient désactivé la bibliothèque JS utilisée lors de l'attaque, nettoyé les systèmes et amélioré la sécurité sans plus de précision. S'il pensait, à ce moment-là, avoir repoussé l'attaque DDoS, quelques heures plus tard, Kahle Brewster était obligé d'annoncer que les attaquants étaient de retour.

D'autres projets touchés

Il signalait d'ailleurs qu'Open Library, projet de catalogage de tous les livres publiés créé en collaboration avec Aaron Swartz notamment, était aussi victime de cette attaque. Si l'inaccessibilité des sites d'Internet Archive touche tous les internautes, elle est particulièrement problématique pour tous les bibliothécaires. Nombre d'entre eux utilisent des services qui s'appuient eux-mêmes sur ceux d'Internet Archive.

Les chercheurs sont aussi touchés. Par exemple, la Biodiversity Heritage Library (BHL), projet de numérisation de la littérature scientifique sur la biodiversité, repose en partie sur Internet Archive. Le site affiche actuellement un bandeau expliquant qu' « Internet Archive est actuellement en panne. Par conséquent, les images des pages ne s'affichent pas dans BHL ».

Un service uniquement assuré par Internet Archive

Ce constat montre l'importance qu'a prise Internet Archive pour l'archivage et les services liés aux bibliothèques à travers le monde. Aucun autre service similaire n'existe sur Internet, ce qui, de fait, centralise l'archivage d'Internet et rend dépendants les internautes des services d'Internet Archive. Il faut dire que l'archivage du web n'est pas une tâche de tout repos. L'année dernière, l'une des « petites mains » du service, Corentin Barreau, nous expliquait son travail au sein d'Internet Archive.

En France, la Bibliothèque nationale de France (BnF) archive depuis 2002 des milliers de sites internet. Mais cet archivage n'est pas aussi simple d'accès que celui d'Internet Archive. Jusqu'en 2014, il fallait se déplacer à Paris, dans les locaux de la BnF pour pouvoir les consulter. Depuis, il est possible d'y accéder sur le site d'autres établissements, et notamment dans des bibliothèques de province. Mais ce service reste indisponible de chez soi.

La BNF a d'ailleurs récemment signé des partenariats concernant des projets d'IA dont l'entrainement reposeraient sur son incroyable réservoir de données. Mais il n'est pas question, pour l'instant, que son fond soit directement accessible à tous les internautes.

Commentaires (3)

votre avatar
La wayback machine semble être de nouveau dispo, en lecture seule, depuis quelques heures : mastodon
Mais il n'est pas question, pour l'instant, que son fond soit directement accessible à tous les internautes.
:craint:
votre avatar
Mais, tu ne te rends pas compte ! Tous ces internautes poilus, plein de verrues plantaires, bavant et postillonnant sur leur écran, et qui en plus, pètent ! :bocul:

Nous Ici, à la BNF, Nous Nous Devons de Préserver la Sereine Majesté, la Dignité, la Noblesse, la Supériorité et la Grande Finesse Gastronomique de nos Archives, Que l'On ne Saurait Jeter en Pâture à... la populace (Oh, Vingt Dieux, Comme ce Mot est Vulgaire !!!), Pourquoi ne pas Donner du Caviar au Cochons, Tant que Vous y Êtes ?

(Uh, uh, uh , je m'étonne parfois moi-même de l'acuité géniâââââle de mon noble esprit, directement hérité des Lumières !)
:fete: :win: :brice: :bisous:
votre avatar
en "situation" dégradée, tant archive.org n'est pas le "mode avion" de l'iphone tant popularisé ;)

Internet Archive en mode dégradé suite au piratage de la semaine dernière

  • Seule la Wayback Machine disponible, en mode dégradé

  • D'autres projets touchés

  • Un service uniquement assuré par Internet Archive

Fermer